本文研究了一个四轮摩托车在城市地区的快速安全航空有效载荷运输的问题。四轮有效载荷系统(QPS)被视为刚体,并以非线性动力学进行建模。城市区域被建模为充满障碍物的环境,并通过合并现实的激光雷达数据获得了障碍物几何形状。我们的有效载荷运输方法分解为高级运动计划和低级轨迹控制。对于低级轨迹跟踪,应用反馈线性化控制将稳定地跟踪四轮驱动器的所需轨迹。对于高级运动计划,我们集成了*搜索和多项式计划,以定义四肢避免碰撞,四极管转子速度的界限和跟踪错误的安全轨迹,并从任意初始位置快速到达目标目的地。
translated by 谷歌翻译
机器教学(MT)是一个互动过程,其中人和机器与训练机器学习模型(ML)的目标相互作用。人类老师交流了他们的任务专业知识,机器学生收集了所需的数据和知识以产生ML模型。 MT系统的开发是共同最大程度地减少教学和学习者错误率的时间。 MT系统中人类互动的设计不仅会影响教学效率,而且通过影响教学质量来间接影响ML的性能。在本文中,我们以先前的工作为基础,在该工作中,我们提出了一个MT框架,其中包括三个组成部分,即教学界面,机器学习者和知识基础,并专注于实现教学涉及的人类互动设计界面。我们概述了从ML任务开始开发MT系统时需要解决的设计决策。该论文遵循苏格拉底式方法,需要在一个好奇的学生和智者老师之间进行对话。
translated by 谷歌翻译
深度神经网络的面部识别模型已显示出容易受到对抗例子的影响。但是,过去的许多攻击都要求对手使用梯度下降来解决输入依赖性优化问题,这使该攻击实时不切实际。这些对抗性示例也与攻击模型紧密耦合,并且在转移到不同模型方面并不那么成功。在这项工作中,我们提出了Reface,这是对基于对抗性转换网络(ATN)的面部识别模型的实时,高度转移的攻击。 ATNS模型对抗性示例生成是馈送前向神经网络。我们发现,纯U-NET ATN的白盒攻击成功率大大低于基于梯度的攻击,例如大型面部识别数据集中的PGD。因此,我们为ATN提出了一个新的架构,该架构缩小了这一差距,同时维持PGD的10000倍加速。此外,我们发现在给定的扰动幅度下,与PGD相比,我们的ATN对抗扰动在转移到新的面部识别模型方面更有效。 Reface攻击可以在转移攻击环境中成功欺骗商业面部识别服务,并将面部识别精度从AWS SearchFaces API和Azure Face验证准确性从91%降低到50.1%,从而将面部识别精度从82%降低到16.4%。
translated by 谷歌翻译
我们描述了对AI代理中既以人为本又基于设计的解释产生的立场。我们通过焦点小组的参与设计收集有关AI代理商的工作问题。我们通过任务方法知识模型捕获代理的设计,该模型明确指定了代理的任务和目标,以及它用于完成任务的机制,知识和词汇。我们通过在Skillsync中产生的解释来说明我们的方法,Skillsync是AI代理,该代理将公司和学院连接起来,以使工人提高和重新锻炼。特别是,我们在Skillsync中嵌入了一个名为AskJill的提问代理,AskJill在其中包含Skillsync设计的TMK模型。AskJill目前回答有关Skillsync任务和词汇的人类生成的问题,从而有助于解释其如何产生建议。
translated by 谷歌翻译
Expression of emotions is a crucial part of daily human communication. Emotion recognition in conversations (ERC) is an emerging field of study, where the primary task is to identify the emotion behind each utterance in a conversation. Though a lot of work has been done on ERC in the past, these works only focus on ERC in the English language, thereby ignoring any other languages. In this paper, we present Multilingual MELD (M-MELD), where we extend the Multimodal EmotionLines Dataset (MELD) \cite{poria2018meld} to 4 other languages beyond English, namely Greek, Polish, French, and Spanish. Beyond just establishing strong baselines for all of these 4 languages, we also propose a novel architecture, DiscLSTM, that uses both sequential and conversational discourse context in a conversational dialogue for ERC. Our proposed approach is computationally efficient, can transfer across languages using just a cross-lingual encoder, and achieves better performance than most uni-modal text approaches in the literature on both MELD and M-MELD. We make our data and code publicly on GitHub.
translated by 谷歌翻译
情绪识别(ER)旨在将人的话语分类为不同的情感类别。基于本文和声学模式之间的早期融合和基于自我注意力的多模式相互作用,在本文中,我们提出了一种多模式多任务学习方法,用于从孤立的单个话语中进行ER。Iemocap基准测试的实验表明,我们提出的模型的表现要比我们对最新的改性的重新实现要好,并且比文献中所有其他单峰和多模式方法更好地实现了性能。此外,强大的基准和消融研究证明了我们提出的方法的有效性。我们在GitHub上公开提供所有代码。
translated by 谷歌翻译
建立AI代理商可能是昂贵的。考虑一个问题应答代理,如Jill Watson,它根据他们的教学大纲和其他课程材料在线课程讨论论坛上自动回答学生的问题。在新的网上课程的教学大纲上训练吉尔可能需要一百小时或更长时间。机器教学 - 使用合成数据集的AI代理的交互式教学 - 可以减少培训时间,因为它结合了基于知识的AI,机器学习的优势,使用大型数据集,以及交互式人循环训练。我们描述了一个互动式机器教学代理的代理史密斯,这减少了按数量级训练新的网上课程训练吉尔的时间。
translated by 谷歌翻译
虽然生成的对抗网络(GaN)是他们对其更高的样本质量的流行,而与其他生成模型相反,但是它们遭受同样困难的产生样本的难度。必须牢记各个方面,如产生的样本的质量,课程的多样性(在课堂内和类别中),使用解除戒开的潜在空间,所述评估度量的协议与人类感知等。本文,我们提出了一个新的评分,即GM分数,这取得了各种因素,如样品质量,解除戒备的代表,阶级,级别的阶级和级别多样性等各种因素,以及诸如精确,召回和F1分数等其他指标用于可怜的性深度信仰网络(DBN)和限制Boltzmann机(RBM)的潜在空间。评估是针对不同的GANS(GAN,DCGAN,BIGAN,CGAN,CONFORDGON,LSGAN,SGAN,WAN,以及WGAN改进)的不同GANS(GAN,DCGAN,BIGAN,SCAN,WANT)在基准MNIST数据集上培训。
translated by 谷歌翻译
该工作研究限制了随机函数是凸的,并表示为随机函数的组成。问题是在公平分类,公平回归和排队系统设计的背景下出现的。特别令人感兴趣的是甲骨文提供组成函数的随机梯度的大规模设置,目标是用最小对Oracle的调用来解决问题。由于组成形式,Oracle提供的随机梯度不会产生目标或约束梯度的无偏估计。取而代之的是,我们通过跟踪内部函数评估来构建近似梯度,从而导致准差鞍点算法。我们证明,所提出的算法几乎可以肯定地找到最佳和可行的解决方案。我们进一步确定所提出的算法需要$ \ MATHCAL {O}(1/\ EPSILON^4)$数据样本,以便获得$ \ epsilon $ -Approximate-approximate-apptroximate Pointal点,同时也确保零约束违反。该结果与无约束问题的随机成分梯度下降方法的样品复杂性相匹配,并改善了受约束设置的最著名样品复杂性结果。在公平分类和公平回归问题上测试了所提出的算法的功效。数值结果表明,根据收敛速率,所提出的算法优于最新算法。
translated by 谷歌翻译